home *** CD-ROM | disk | FTP | other *** search
/ Internet Info 1994 March / Internet Info CD-ROM (Walnut Creek) (March 1994).iso / inet / isoc / isoc_news / issue1-2 / n-1-2-040.31.2a < prev    next >
Text File  |  1993-03-01  |  6KB  |  149 lines

  1.  
  2. N-1-2-040.31.2  The Resource Discovery Problem by 
  3. Peter Deutsch*, (peterd@cc.mcgill.ca)
  4.  
  5.  
  6. It may be argued that as the Internet has grown from a collection of
  7. hundreds of machines to one of hundreds of thousands of machines a
  8. fundamental shift in focus is occurring among its users.  Rather than
  9. seeing themselves as primarily interacting with other individuals on
  10. the net, users more and more have come to see themselves as
  11. interacting with "the net" itself, with a vast pool of machines and
  12. their associated resources that function as a virtual provider of
  13. electronic goods and services.
  14.  
  15. As this perception of the Internet as a collection of services has
  16. grown, a new problem has presented itself to would-be service
  17. providers.  This problem, the so-called "Resource Discovery Problem",
  18. must be adequately addressed if we are to move towards a true
  19. Internet-wide model of resource access.
  20.  
  21. The basic problem can be broken down into four sub-problems - Class
  22. Discovery, Instance Location, Instance Access and information
  23. Management.  Let us examine each of these in turn:
  24.  
  25. Class Discovery refers to the seeking out a specific type of service
  26. in a larger community of service providers, presumably without any a
  27. priori knowledge of the existence or relevance of specific service
  28. providers.  Thus, a user might seek to locate "collections of
  29. information dealing with the genome project", or "collections of
  30. freely available software", without knowing what specific services
  31. exist to satisfy such queries.
  32.  
  33. In an idealized system, a "Class Discovery Service" (perhaps a better
  34. term would be "Resource Information Service") could be asked such
  35. general questions, and would reply with a set of appropriate service
  36. providers.  A representative reply to such a query might be a list of
  37. archive indexers, a set of relevant anonymous FTP archives and perhaps
  38. the names and locations of relevant WAIS and Gopher servers.
  39.  
  40. Once the existence of a specific collection of service providers
  41. appropriate to the problem has been established a user can proceed to
  42. Instance Location.  For example, once the location of various anonymous
  43. FTP archive sites and archive indexers has been established, a user
  44. might then send queries to the relevant collection of archive
  45. indexers, limiting the search to the specified sets of archives to
  46. speed the search.  The replies in this case would be references to
  47. specific files on the network that respond to the user's search
  48. criteria.
  49.  
  50. The final step in information discovery is Instance Access.  Carrying
  51. out this step would involve using the appropriate access method (using
  52. such protocols as FTP, WAIS/Z39.50 or Gopher, as appropriate).
  53.  
  54. A final problem remains - Information Management. Once a user has
  55. discovered relevant references, he or she may not wish to store
  56. specific copies of information, but rather may instead elect to build
  57. up libraries of references, provided the underlying tools are capable
  58. of resolving such references as needed.
  59.  
  60. Work is underway to standardize these references to allow the use of
  61. "Universal Document Identifiers" (or UDIs) across multiple systems.
  62. Such UDIs would allow the sharing of references to information across
  63. multiple information systems across the Internet, so that queries to
  64. archie could give back pointers to Gopher or WWW documents as well as
  65. files available through Anonymous FTP.
  66.  
  67. Practical, useful services have been developed and deployed by a
  68. number of researchers (currently using entirely volunteer resources)
  69. that address most parts of the Resource Discovery problem.  The past 18
  70. months has seen the creation of such services as archie, Prospero,
  71. WAIS, WWW and Gopher, among others.  Each successfully attacks some
  72. portion of the problem.
  73.  
  74. Thus, the user menus in the Gopher system may be seen as a library of
  75. references to specific information and service providers on the
  76. Internet and the Gopher service itself (which allows the user to
  77. resolve these references in a transparent manner) in one example of
  78. the power of Instance Access tools.
  79.  
  80. Similarly, the archie system nay been seen as a simple and fast
  81. indexing service to perform Instance Location, returning references
  82. that can then be resolved using appropriate Instance Access software
  83. (be it the venerable "ftp" command, the Gopher-archie gateway or the
  84. appropriate portion of one of the newer GUI-based archie access
  85. tools).
  86.  
  87. WAIS provides Instance Location and Access and Prospero and WWW both
  88. provide means for organizing and accessing information, Prospero at
  89. granularity of individual files and WWW at the level of hypertext
  90. documents.
  91.  
  92. Despite the success of these early experimental systems, much work
  93. remains to be done.  The existing services need to be further refined
  94. and expanded, then deployed as real, funded and supported services. In
  95. addition, one major portion of the problem still remains to be
  96. addressed.
  97.  
  98. There still exists a need for tools to aid in the Class Discovery
  99. step.  This is becoming more pressing with the success of the systems
  100. listed above as their are now in fact a significant number of service
  101. providers to be accessed. For example, over 200 locations provide
  102. Gopher servers and a similar number provide WAIS sources, while there
  103. are close to 15 archie servers now available on the Internet.  New
  104. services continue to be deployed each week.
  105.  
  106. There are now plans to deploy an experimental Resource Information
  107. Service to address this problem, using a modified version of the
  108. current archie service.  The plan is to automatically gather and store
  109. the descriptions and locations of such services in a new archie
  110. database, then use archie's proactive data-gathering model to keep the
  111. database up to date, periodically verifying that specific services are
  112. still up and available.  Users will be able to query this new database,
  113. seeking out services by their type or descriptions.
  114.  
  115. Current plans call for the deployment of this experimental RIS server
  116. by July, 1992.  Watch the net for more details in the coming months.
  117.  
  118.  
  119. *President, Bunyip Information Systems
  120.  
  121.  
  122.  
  123.  
  124.  
  125.  
  126.  
  127.  
  128.  
  129.  
  130.  
  131.  
  132.  
  133.  
  134.  
  135.  
  136.  
  137.  
  138.  
  139.  
  140.  
  141.  
  142.  
  143.  
  144.  
  145.  
  146.  
  147.  
  148.  
  149.